深圳裕策生物科技有限公司
裕策生物 | YuceBio
数字空间靶向蛋白组学分析报告
东海省津海市肿瘤医院
报告编号 | 20220117:7266
January 17, 2022


1 报告基础信息

1.1 项目信息

本项目相关信息在下方表格中呈现。
报告全称 裕策生物数字化空间靶向蛋白组学分析报告-科研
项目编号 YuceNeo 0023
项目名称 裕策生物数字化空间靶向蛋白组学分析服务项目
客户单位 东海省津海市肿瘤医院
样本简介 1张TMA,共圈选收集36个AOI
研究目标 不同样本间空间蛋白表达谱差异
项目设计 使用DSP空间蛋白组技术结合Core Panel + 1 Module中的全部靶标混合物对TMA切片进行检测
报告时间 2021.10.29
分析程序 YuceBio | YuceNeo EPARS自动化报告与分析流程系统 v1.0
分析部门 生信分析与数据科学部
审核部门 项目部


1.2 主要简写与名词解释

本报告中出现的专有名词缩写对应的意义和中文翻译在下方表格中呈现。
名称缩写 对应定义 对应中文翻译
DSP Digital Spatial Profiling 数字空间多组学分析技术
QC Quality Control 质量控制
NGS Next Generation Sequencing 第二代测序技术
FFPE Formalin-Fixed, Paraffin-Embedded 石蜡切片
ROI Region of interest 感兴趣区域
AOI Area of illumination 紫外捕获区域
FOV Field of View 视场
H&E Hematoxylin and Eosin stain 苏木精-伊红染色
FC Fold Change 差异表达倍数
HK House Keeping (gene) 管家(基因)
TME Tumor MicroEnvironment 肿瘤微环境
PCA Principal Component Analysis 主成分分析
DE Differential Expression (Analysis) 差异表达 (分析)
TAP Technology Access Program 平等获取技术计划
ERCC External RNA Control Consortium 外部RNA阴阳性对照组合
NTC No Template Control Count 无模板阴性对照


2 实验方法

2.1 DSP 技术原理

The GeoMx Digital Spatial Profiling (DSP) technology, GeoMx数字空间多组学分析技术,是由NanoString公司开发的新型平台,它的具体技术原理(Van and Blank 2019)可以被概括为:

亲和试剂(例如抗体或 RNA 探针)通过 UV 可切割接头(PC-oligo)共价连接到特异核苷酸(indexing oligo)。对兴趣点(ROI)的UV光解可以精确释放感兴趣区域的特异核苷酸,通过NanoString nCounter系统进行数字量化,根据这些离散 ROI 内的详细表达谱实现信号解读。

过往利用DSP技术平台的科研成果和发表文献可参阅:(Pelka et al. 2021)(Bergholtz et al. 2021)(Cabrita et al. 2020)

2.2 实验操作流程概述

  1. 组织固定后进行多靶标抗体染色

  2. 根据荧光抗体染色图像查看并选择ROI

  3. 对选定的ROI进行紫外光照射,特异核苷酸照射后被释放至载玻片上方水性液体

  4. 微毛细管收集仅限于ROI的光裂解寡核苷酸,不接触样本

  5. 转移吸取的光裂解寡核苷酸至96孔板中

  6. 重复UV照射及收集步骤直至收集完所有ROI,每个循环间进行大量清洗

  7. 使用NGS进行定量

2.3 仪器和试剂信息

本实验过程中使用到的仪器和试剂相关信息点击后在表格中呈现
设备名称 供应商 备注
nCounter Dx FLEX NanoString Prep Station + Digital Analyzer
GeoMx Digital Spatial Profiler NanoString

物料编码 物料名称 品牌
AN1001 二甲苯(1330-20-7) 汕头光华
AN0897 无水乙醇(分析纯) 西陇
AN0899 95%乙醇(分析纯) 上海凌峰试剂
AN1031 改进型柠檬酸钠抗原修复液(50x)
AN1498 10X TBS-T缓冲液 索莱宝 
AW1428 GeoMx Protein Slide Prep Kit PCLN NanoString
AW1434 GeoMx Solid Tumor TME Morphology Kit Human Protein Compatibie NanoString
AW1430 GeoMx Immune Cell Profiling Panel Human Protein Core for nCounter NanoString
AW0971 Fixative Solution 4% formaldehyde prepared in PBS(4% PFA) invitrogen
AW0962 Fluoromount-G(抗荧光淬灭剂) SouthernBiotech
AN0898 75%乙醇清洗液 利尔康
AW1513 Molecular BioProducts™ RNase™ AWAY ThermoFisher
AN1497 20X TBS缓冲液 索莱宝 
BW0957 PAP pen (ab2601)免疫组化疏水笔 Abcam
BW0850 1.5ml 离心管 AXYGEN
BW0854 50mL离心管 CORNING
BW0842 10/20ul滤芯吸头 Rainin
BW0843 200/250ul滤芯吸头 Rainin
BW0844 1000ul滤芯吸头 Rainin
AW0974 AeraSeal™ film (Permeable membrane (dry-down seal) SIGMA-ALDRICH
BW0958 杂交覆盖盖玻片 HybriSlip™ Hybridization Covers Grace Bio-Labs
AW1291 GeoMx DSP Collection Plate NanoString
AW1557 GeoMx Immune Activation Status PanelHuman Protein Module for nCounter NanoString
Immune Activation Status Ab Mix_Hs NanoString
Immune Activation Status Probe R_3_Hs_nC NanoString
AW1432 GeoMx IO Drug Target Panel NanoString
AW1433 GeoMx Immune Cell Typing Panel NanoString
Immune Cell typing Ab Mix_Hs NanoString
Immune Cell typing Probe R_4_Hs_nC NanoString
AW1245 GeoMx Pan-Tumor Panel Human Protein Module for nCounter NanoString
Pan Tumor Ab Mix_Hs NanoString
Pan Tumor Probe R_5_Hs_nC NanoString
AW1563 nCounter PanCancer Pathway Panel NanoString
Cancer Pathway Capture Probeset NanoString
Cancer Pathway reporter Codeset NanoString
AW1560 GeoMx MAPK Signaling Panel Human Protein Module for nCounter 24 Slides NanoString
MAPK signaling Ab Mix_Hs NanoString
MAPK signaling Probe R_4_Hs_nC NanoString
AW1561 Substitute Probe R_5 for GeoMx MAPK Signaling Human Protein Module NanoString
AW1558 GeoMx Cell Death Panel Human Protein Module for nCounter 12 Slides NanoString
Cell Death Ab Mix_Hs NanoString
Cell Death Probe R_6_Hs_nC NanoString
AW1559 GeoMx PI3K/AKT signaling Panel Human Protein  Module for nCounter 24 Slides NanoString
PI3K/AKT signaling Ab Mix_Hs NanoString
PI3K/AKT signaling Probe R_7_Hs_nC NanoString
AW1430 GeoMx Immune Cell Profiling Panel Human Protein Core for nCounter NanoString
Immune cell profiling Ab Mix_Hs NanoString
Immune cell profiling Probe R_1_Hs_nC NanoString
AW1562 nCounter PanCancer Immune Profiling Panel NanoString
Cancer Immune Profiling Capture Probeset NanoString
Cancer Immune Profiling reporter Codeset NanoString

2.4 形态学marker信息

本项目在DSP技术平台上使用到的形态学标志物(Morphology Markers)在下方表格中呈现。
Channel Biological.Target Color
FITC DNA (nuclei) Red
Cy3 PanCK (Tumor) Green
Texas Red CD45 (immune) Yellow
Cy5 CD68 (Macrophages) Blue

2.5 Panel信息

本项目使用Panel的信息在点击后将以表格呈现
Immune.Cell.Profiling.Panel.Human.Protein.Core Immune.Activation.Status.Panel.Human.Protein.Module
Beta-2-microglobulin CD127
CD11c CD25
CD20 CD27
CD3 CD40
CD4 CD44
CD45 CD80
CD56 ICOS
CD68 PD-L2
CD8
CTLA4
Pan-cytokeratin
Fibronectin
GZMB
HLA-DR
Ki-67
PD-1
PD-L1
SMA
Ms IgG2a
MS IgG1
Rb IgG
Histone-H3
S6
GAPDH

2.6 AOIs信息

本项目包含的所有AOIs实验方面的信息在下方以表格呈现。
ROI_ID Segment_tag LOT_Human_Immune_Cell_Profiling_Protein_Core LOT_Human_Immune_Cell_Typing_Protein_Module LOT_Human_Immune_Activation_Status_Protein_Module LOT_Human_IO_Drug_Target_Protein_Module LOT_Substitute_R_5_Human_MAPK_Signaling_Protein Scan_ID Unique_Sample_ID
096 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_096_TM
095 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_095_Tumor
094 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_094_Tumor
093 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_093_TM
092 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_092_Tumor
091 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_091_Full ROI
090 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_090_Tumor
089 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_089_Tumor
088 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_088_Tumor
087 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_087_Tumor
086 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_086_Tumor
085 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_085_Tumor
084 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_084_Tumor
083 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_083_Tumor
082 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_082_Tumor
081 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_081_Tumor
080 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_080_Full ROI
079 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_079_Tumor
078 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_078_Tumor
077 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_077_Tumor
076 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_076_Full ROI
075 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_075_TM
074 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_074_Tumor
073 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_073_Full ROI
072 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_072_TM
071 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_071_Tumor
070 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_070_Full ROI
069 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_069_TM
068 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_068_Tumor
067 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_067_Full ROI
066 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_066_Full ROI
065 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_065_Full ROI
064 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_064_Tumor
063 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_063_Full ROI
062 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_062_TM
061 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_061_Tumor
060 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_060_TM
059 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_059_TM
058 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_058_TM
057 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_057_Tumor
056 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_056_TM
055 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_055_Tumor
054 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_054_Full ROI
053 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_053_Full ROI
052 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_052_Full ROI
051 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_051_Tumor
050 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_050_TM
049 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_049_Tumor
048 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_048_Full ROI
047 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_047_TM
046 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_046_Tumor
045 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_045_TM
044 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_044_Tumor
043 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_043_Full ROI
042 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_042_Full ROI
041 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_041_Tumor
040 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_040_Full ROI
039 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_039_Full ROI
038 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_038_Tumor
037 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_037_Full ROI
036 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_036_Tumor
035 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_035_TM
034 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_034_Tumor
033 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_033_Full ROI
032 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_032_Full ROI
031 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_031_Tumor
030 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_030_TM
029 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_029_Tumor
028 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_028_Full ROI
027 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_027_Tumor
026 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_026_TM
025 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_025_Tumor
024 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_024_TM
023 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_023_Tumor
022 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_022_Full ROI
021 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_021_Full ROI
020 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_020_TM
019 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_019_Tumor
018 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_018_TM
017 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_017_Tumor
016 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_016_Full ROI
015 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_015_Full ROI
014 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_014_Full ROI
013 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_013_Tumor
012 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_012_Tumor
011 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_011_TM
010 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_010_Tumor
009 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_009_Full ROI
008 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_008_Full ROI
007 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_007_TM
006 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_006_Tumor
005 L ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_005_Full ROI
004 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_004_TM
003 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_003_Tumor
002 TM ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_002_Full ROI
001 Tumor ICPH10001 ICTH10001 0474032 0474029 0474047 21R9976SLZA 21R9976SLZA_001_Tumor



3 数据质控

为了确保每个AOI中数据的质量,所有原始数据集都需要通过建议的质量控制(QC)指标进行处理。 数据质控的指标其中包括:
(1) 视场(FOV)记录和结合密度QC参数监视nCounter运行的质量。
(2) 标准化阳性对照QC设置阳性ERCC标准化因子的可接受范围。
(3) 最小细胞核数量和表面积参数,标记低于建议的细胞核数量或表面积的AOI。

QC相关的数据图表将被保存至 ./results/1.Quality_Control/

3.1 管家基因质控

管家基因介绍
管家基因 Housekeeping Genes (HK genes) 是指某一类基因的集合。这类基因在所有细胞中均有表达,是细胞维持基本生命活动所需的相对保守的基因。因为管家基因的表达持续并且受环境因素影响较少,所以细胞管家基因的几何平均数表达可以用作该细胞表达信号强度的参考。使用HK genes对所有AOIs进行质控,其目的旨在筛选出用于后续数据分析中的合格AOIs,移除QC失败的不合格AOIs。该步骤同时衡量信号强度和背景值。

3.1.1 管家基因密度

几何平均数介绍
几何平均数(Geometric Mean, Geomean)作为一种均值表现方法,在分析过程中常被使用。它使用所有样本值的乘积来指示一组数字中的集中趋势或典型值。对于一组数字\(x_{1},x_{2}, \dots, x_{n}\),它们的几何平均数的定义为:\[(\prod_{i=1}^{n} x_i)^{\frac{1}{n}} = \sqrt[n]{x_1x_2 \dots x_n}\]

因为管家基因的表达高度稳定,其密度分布被认为接近随机的正态分布。此密度图的分布可用来判断是否出现离群不合格的AOI,如有与分布偏差较大的极端异常值会被作为参考在后续分析中剔除。下图为绘制的本项目所有AOIs含有的管家基因(S6, Histone H3, GAPDH)表达的几何平均数的密度图。此图中横坐标为各AOI管家基因几何平均数的对数值,纵坐标为横坐标该数值出现的频率。
下方密度图的呈现中所有AOIs的管家基因几何平均数呈现正态分布趋势,无明显离群分布的AOI。所有AOIs通过此步质控。

3.1.2 管家基因样本间分布

因为管家基因的表达高度稳定,其在样本间的分布同样可以用来判断数据中是否存在分组间的偏见。若AOIs的管家基因对于某个组别或分类条件没有明显的偏向性则通过此质控步骤。下图绘制了AOIs管家基因的几何平均数分布图。根据与项目中实验设计方案有关的AOIs分组信息(Segment_tag),下方按标签页呈现了不同着色方式的管家基因分布。


下方管家基因样本间分布图的呈现中,在不同分组的条件下,未见明显的偏向性聚类,AOIs的不同组别之间相对均匀分布。所有AOIs通过此步质控。

Segment_tag

3.2 靶标质控

靶标质控(Probe QC)是对于所有靶标质量管理的控制步骤。IgG基因的表达信号可以作为背景信号或阴性对照信号。通过比较所有靶标与IgG阴性对照的表达情况,可以识别潜在性能不佳的靶标。本实验使用如下IgG基因: Ms IgG1, Ms IgG2a, Rb IgG作为阴性对照。下图所示的箱线图展现的是各AOI中各靶标的计数值与IgG阴性对照计数值的比值,并取其比值的对数值(log2)。此纵坐标的数值呈现的是每个靶标与阴性对照计数值的差异关系。此数值越高,则意味着该靶标信号相较于IgG越高。此数值显著偏低的靶标意味着其表达显著低于阴性对照,需要谨慎使用并进一步研究解释其计数值低于背景值的原因。需要注意的是,因为靶标的信号值和许多因素有关,包括AOI的种类,组织的类型和样本/AOI所具有的生物学意义,因此靶标的信号值偏低并不绝对意味着靶标质量偏低。
下方靶标质控箱线图的呈现中,靶标分布正常,较低靶标的计数值在正常范围内,即无靶标显著低于IgG阴性对照。所有靶标通过质控。

3.3 IgG 背景校正

数据归一化包括基于IgG的背景矫正,基于管家基因的背景矫正等方式。北京矫正的原理是:如果绝大多数探针功能正常,即能准确反应出信号强度时,其检测信号应高度相关。下图为对校正因子IgG基因进行的相关性质控。根据与项目中实验设计方案有关的AOIs分组信息(Segment_tag),下方按标签页呈现了IgG基因两两之间的相关性及各自在各个AOI的count值。本项目中使用基于IgG基因表达水平的背景校正方式。
下方IgG 背景校正图的呈现中,IgG两两之间相关性较高,整体表达水平统计学意义上稳定,适合作为数据归一化的方法依据。因此本项目数据使用基于IgG的方式进行背景矫正的方式准确。

Segment_tag

3.4 QC 信息总览

质控完成后,对应每个AOI,质控相关的详细信息点击后在表格中呈现
Scan.name ROI.name Segment.name QC.status ROI.X.Coordinate ROI.Y.Coordinate Tags Binding.Density FoV.registration.QC Positive.norm.factor Surface.area Nuclei.count QC.flags
21R6616SLZA 1 Tumor PASSED 5624.000 44348.00 Tumor 0.45 1.0000000 1.0799290 27942.275 87
21R6616SLZA 1 M PASSED 5624.000 44348.00 M 0.39 0.9964286 1.2195079 10935.689 94
21R6616SLZA 2 M PASSED 6048.000 35496.00 M 0.32 0.9928571 1.0146891 16425.473 211
21R6616SLZA 3 NOA PASSED 5268.000 42958.00 NOA 0.32 1.0000000 1.8706828 27290.637 428
21R6616SLZA 4 L PASSED 6214.000 45114.00 L 0.31 1.0000000 0.5446836 10452.385 214
21R6616SLZA 5 Tumor PASSED 14725.323 43457.78 Tumor 0.24 0.9857143 1.3223252 43657.711 485
21R6616SLZA 6 M PASSED 15611.000 43315.00 M 0.29 1.0000000 1.1402428 10356.809 150
21R6616SLZA 7 NOA PASSED 14252.000 42296.00 NOA 0.22 1.0000000 1.0969358 8481.194 144
21R6616SLZA 8 L PASSED 13363.000 41676.00 L 0.31 1.0000000 1.0414619 9164.426 202
21R6616SLZA 9 Tumor PASSED 23599.555 41904.29 Tumor 0.35 1.0000000 1.0013887 44441.305 498
21R6616SLZA 10 M PASSED 22200.506 43879.55 M 0.42 0.9964286 1.1961032 17812.359 375
21R6616SLZA 11 NOA PASSED 23195.000 44069.00 NOA 0.46 0.9928571 1.2431939 19021.815 286
21R6616SLZA 12 L PASSED 20760.000 41844.00 L 0.45 1.0000000 0.9900776 15699.799 426
21R6616SLZA 13 Tumor PASSED 4871.542 28965.83 Tumor 0.39 0.9964286 1.1664477 45647.411 253
21R6616SLZA 14 M PASSED 5380.000 31177.00 M 0.32 0.9928571 0.9788649 9842.551 293
21R6616SLZA 15 L PASSED 3671.000 31111.00 L 0.32 1.0000000 1.6750731 10327.131 223
21R6616SLZA 16 NOA PASSED 6506.000 29082.00 NOA 0.31 1.0000000 0.5468761 21415.199 460
21R6616SLZA 17 Tumor PASSED 12306.000 27774.00 Tumor 0.24 0.9857143 1.2268811 30657.649 653
21R6616SLZA 18 M PASSED 11822.000 29421.00 M 0.29 1.0000000 1.0521457 32212.870 356
21R6616SLZA 19 NOA PASSED 11854.000 31334.00 NOA 0.22 1.0000000 0.9946349 46672.736 1303
21R6616SLZA 20 Tumor PASSED 28724.256 42632.21 Tumor 0.31 1.0000000 0.9571846 44539.912 458
21R6616SLZA 21 M PASSED 31429.000 41357.00 M 0.35 1.0000000 0.9364439 4246.501 48
21R6616SLZA 22 L PASSED 31679.000 41939.00 L 0.42 0.9964286 1.1320730 15776.547 99
21R6616SLZA 23 NOA PASSED 30314.000 43124.00 NOA 0.46 0.9928571 1.1815963 16410.155 183
21R6616SLZA 24 Tumor PASSED 4057.082 15300.77 Tumor 0.45 1.0000000 0.9603880 39981.793 174
21R6616SLZA 25 L PASSED 5245.000 17218.00 L 0.39 0.9964286 1.0194205 7479.962 63
21R6616SLZA 26 NOA PASSED 5462.000 17777.00 NOA 0.32 0.9928571 0.8483956 21335.260 64
21R6616SLZA 27 M PASSED 4554.000 15718.00 M 0.32 1.0000000 1.5454741 5503.346 59
21R6616SLZA 28 Tumor PASSED 13156.091 16138.80 Tumor 0.31 1.0000000 0.4620681 30896.668 584
21R6616SLZA 29 M PASSED 12890.207 17503.40 M 0.24 0.9857143 1.0892537 25705.738 317
21R6616SLZA 30 L PASSED 12123.000 16516.00 L 0.29 1.0000000 0.9887072 18275.399 243
21R6616SLZA 31 NOA PASSED 11493.000 15006.00 NOA 0.22 1.0000000 1.0330765 24578.933 381
21R6616SLZA 32 Tumor PASSED 20667.795 14433.51 Tumor 0.31 1.0000000 0.9387603 48053.718 314
21R6616SLZA 33 M PASSED 18919.000 15159.00 M 0.35 1.0000000 0.9450877 16854.208 366
21R6616SLZA 34 NOA PASSED 21327.000 14973.00 NOA 0.42 0.9964286 1.0214458 31839.502 569
21R6616SLZA 35 M PASSED 21440.000 21144.00 M 0.46 0.9928571 1.2280121 30922.995 277

QC汇总信息的表格同时将被保存至 ./results/1.Quality_Control/ 以供筛选查看。

4 数据分析

针对经过数据质控之后合格的数据,开展了如下的数据分析研究,其基本流程如下图所示:

4.1 蛋白表达谱总览

本部分针对用户所选的panel进行了蛋白表达谱的分析,用热图展示。热图分析使用了无监督的层次聚类来分析每个AOI的蛋白表达量之间的相关性。每一列代表一个AOI,每一行是一个蛋白。对每个蛋白表达值分别进行了归一化处理,让均值为0和标准差为1。将归一化的值在平均值±2倍标准偏差处进行截尾处理,以确保最大比例的数据的颜色分布正常(99% 的数据在平均值的 ± 2 标准偏差内)。其位于同一簇同一分支的AOIs在某种程度上是相似的,不同分支的AOIs则不太相似。

蛋白表达谱总览的分析相关的数据图表将被保存至 ./results/2.Overall_Analysis/

4.1.1 所有分组蛋白表达热图

下图根据用户给出的分组信息,对所有分组进行聚类热图(Gu, Eils, and Schlesner 2016)的展示,可对AOIs之间表达的相似程度进行推断。其中数据均进行了归一化处理,让均值为0和标准差为1。将归一化的值在平均值±2倍标准偏差处进行截尾处理,以确保最大比例的数据的颜色分布正常(99% 的数据在平均值的 ± 2 标准偏差内)。默认使用最小方差法ward.D2聚类方法构建距离矩阵,距离值越小则AOIs之间的相似度越大。其分析结果如下图所示,横轴代表每个AOI,纵轴代表用户所选panel中的每个蛋白,示例注释列在热图的顶部,图例显示了AOIs分组信息,其蛋白表达值用渐变颜色表示。


4.2 AOIs降维算法

降维介绍

降维(Dimensional Reduction technique)是一种统计学/机器学习方法,其目的为从一个大体量(高维度)的数据中,筛除冗余或无关变量并从原有变量中找出主要变量。特征选择 (feature selection)特征提取 (Feature projection / Feature extraction) ,就是对高维度数据结构处理的典型方法。
·特征选择,提取数据子集,简化数据模型,去掉冗余和无关数据。
冗余数据:数据可以展现整体数据的特征,拥有生物学意义,但是与其他特征强相关
无关数据: 低质量数据,基本无法体现特征
特征选择应用场景: 机器学习,数据挖掘,多类型的高维生信数据,比如DNA微阵列, 表达谱,单细胞, SNPs 等
·特征提取或者被口语化称为狭义的降维。和特征选择相似,从高维度数据 (多个特征向量空间)中简化数据模型,去掉冗余和无关信息,提升计算处理效率。其理论支撑是认为数据都是有结构的,在低维度的数据结构中精炼提取数据结构的核心信号。降维处理后可产生低维度可视化图像,服务于研究中的分析理解。


为了解不同分组之间ROI/AOI中蛋白表达的相似或不同之处并观察数据的变化呈现上是否在AOIs的分组间存在偏见,我们采用了狭义上的降维,即特征提取,来识别相似片段的簇。特征提取其中又可分为线性降维非线性降维
·线性降维:低维向量的分量由相应高维向量的分量的线性函数给出,所以低维空间一定是线性变化出的空间中的一个。其中可包含Principal component analysis (PCA),Linear discriminant analysis (LDA), Independent component analysis (ICA) 等
·非线性降维:假设数据是镶嵌在高维空间是非线性的流形上,可以局部欧几里得空间化的一个拓扑空间。试图在低维空间保留数据流形结构。其中可包含T-distributed Stochastic Neighbor Embedding (t-SNE), Uniform manifold approximation and projection(UMAP),Isomap,Locally-linear embedding (LLE), autoencoder 等

4.2.1 PCA降维

PCA介绍
主成分分析,Principle Component Analysis(PCA)是用来探索和简化多变量复杂关系的常用方法,及即通过降维找到数据间差异的最主要特征。PCA是线性降维中最重要的方法。
在表达谱数据中,AOIs之间的关系即为每个AOI中assay的表达。AOIs在每一个assay表达的差异可被视为一个单独的维度,整个表达谱即所有的assay表达共同汇聚成一个多维空间。PCA试图从此多维空间中将特征提取为主成分(Principle Component, PC)。每个主成分解释了数据中一定百分比的变化。
进行主成分分析前数据进行缩放,找到特征向量(主成分,PC)来聚类AOIs,并展示AOIs在包含最大的数据差异的前两个主成分上的分布。

为了探究各AOIs之间关系,使用主成分分析(PCA)分析AOIs差异的主要特征。在如下的二维图像中,x轴横轴代表的是第一主成分,y轴纵轴是第二主成分,均显示此主成分可以解释的数据间差异所占总数据差异的百分比。根据与项目中实验设计方案有关的AOIs分组信息(Segment_tag),下方按标签页呈现了不同着色方式的PCA图像,图例均为AOIs分组的着色信息。

Segment_tag

4.2.2 tSNE降维

tSNE介绍
t-distributed stochastic neighbor embedding (t-SNE/tSNE) (Van der Maaten and Hinton 2008)是特征提取中非线性降维的方法之一。tSNE的步骤可以被概括为:
1. tSNE构建一个高维对象之间的概率分布,使得相似的对象有更高的概率被选择,而不相似的对象有较低的概率被选择
2. t-SNE在低维空间里在构建这些点的概率分布,使得这两个概率分布之间尽可能的相似。
值得注意的是,tSNE算法已被认为存在些许缺陷。最主要的缺陷是tSNE的图像趋向于保留局部结构,缺乏全局的保留,即只有近距离/聚类内部的数据点间距离保留了充分的意义,而远距离数据点的不相似性不能保证(即降维图中相近的细胞更加相似,但距离很远的细胞并不一定意味着更不相似)。同时在运算过程中主要是在选取大的perplexity时K-nearest neighbor的步骤时,运用过量内存使得计算成本较高。

为了探究各AOIs之间关系,使用tSNE降维分析AOIs差异的主要特征。在如下的二维图像中,x轴和y轴代表的是经tSNE降维处理后二维坐标轴,每一个点对应一个AOI。根据与项目中实验设计方案有关的AOIs分组信息(Segment_tag),下方按标签页呈现了不同着色方式的tSNE二维化图像,图例均为AOIs分组的着色信息。

Segment_tag

4.2.3 UMAP降维

UMAP介绍
Uniform Manifold Approximation and Projection (UMAP) (McInnes, Healy, and Melville 2018)是另一个非线性降维方法。UMAP 总体上遵循tSNE的理念,但引入了许多改进,如不同的cost function以弥补全局信息的保留,normalization的免除等等。 具体算法的区别包括,用binary cross-entropy (CE) 作为它的cost function,与 t-SNE的KL-divergence不同,成对欧几里得距离的概率不会指数级衰减。在高维中使用exponential probability distribution取代Euclidean distances,在低维中curves 1 / (1+a*y^(2b)) 取代t-distribution 用nearest neighbors个数代替t-SNE的perplexity。因为计算方式,概率已经属于[0,1],不采用额外normalization,和tSNE相比显著会降低运算时间。
UMAP现在被更多学者接受,认为在大多数情况下是比tSNE更有效的非线性降维方式。实际情况中仍需根据数据分布等具体情况选择降维方法。对体量较大的数据,PCA筛选和非线性降维的结合是讨论中适合的方式,但没有共识。

为了探究各AOIs之间关系,使用UMAP降维分析AOIs差异的主要特征。在如下的二维图像中,x轴和y轴代表的是经UMAP降维处理后二维坐标轴,每一个点对应一个AOI。根据与项目中实验设计方案有关的AOIs分组信息(Segment_tag),下方按标签页呈现了不同着色方式的UMAP二维化图像,图例均为AOIs分组的着色信息。

Segment_tag

4.3 AOIs相关性分析

相关性分析介绍
相关性分析,Correlation Analysis,是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
相关性分析中最常用的方法为使用皮尔森相关系数。皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,Pearson’s r)用于度量两个变量X和Y之间的相關程度(线性相关),其值介于-1与1之间。该系数广泛用于度量两个变量之间的线性相关程度。 计算x和y的相关性参数\(r_{xy}\)的方式如下: \[r_{xy} = \frac{cov(x,\ y)}{\sqrt{var(x)}\ *\ \sqrt{var(y)}}\]

进一步分析各AOIs之间的相关性,对用户选取的AOI/ROI总体表达进行相关性分析(Wei and Simko 2021)。AOIs之间的两两相关性以pearson系数的方式被计算,数值分布在[-1,1]。Pearson数值为0时代表两AOI之间无线性关系。数值的绝对值越高,AOI之间的相关性也越高。正值代表AOI之间呈正相关关系,负值代表AOI之间呈现负相关关系。 下图呈现的是所有AOIs间的相关性,横纵轴均代表每个ROI/AOI,名称显示在顶部和左侧,渐变颜色显示AOIs间pearson相关系数值,从[-1,1]以从蓝至红显示。

4.4 蛋白相关性分析

下图呈现的是所有蛋白间的相关性,横纵轴均代表每个蛋白,名称显示在顶部和左侧,渐变颜色显示AOIs间pearson相关系数值,从[-1,1]以从蓝至红显示。

5 参考文献


Bergholtz, Helga, Jodi M. Carter, Alessandra Cesano, Maggie Chon U Cheang, Sarah E. Church, Prajan Divakar, Christopher A. Fuhrman, et al. 2021. “Best Practices for Spatial Profiling for Breast Cancer Research with the GeoMx® Digital Spatial Profiler.” Cancers 13 (17).
Cabrita, Rita, Martin Lauss, Adriana Sanna, Marco Donia, Mathilde Skaarup Larsen, Shamik Mitra, Iva Johansson, et al. 2020. “Tertiary Lymphoid Structures Improve Immunotherapy and Survival in Melanoma.” Nature 577 (7791): 561–65.
Gu, Zuguang, Roland Eils, and Matthias Schlesner. 2016. “Complex Heatmaps Reveal Patterns and Correlations in Multidimensional Genomic Data.” Bioinformatics 32 (18): 2847–49.
McInnes, Leland, John Healy, and James Melville. 2018. “Umap: Uniform Manifold Approximation and Projection for Dimension Reduction.” arXiv Preprint arXiv:1802.03426.
Pelka, Karin, Matan Hofree, Jonathan H. Chen, Siranush Sarkizova, Joshua D. Pirl, Vjola Jorgji, Alborz Bejnood, et al. 2021. “Spatially Organized Multicellular Immune Hubs in Human Colorectal Cancer.” Cell 184 (18): 4734–4752.e20.
Van der Maaten, Laurens, and Geoffrey Hinton. 2008. “Visualizing Data Using t-SNE.” Journal of Machine Learning Research 9 (11).
Van, Trieu My, and Christian U Blank. 2019. “A User’s Perspective on GeoMxTM Digital Spatial Profiling.” Immuno-Oncology Technology 1: 11–18.
Wei, Taiyun, and Viliam Simko. 2021. R Package ’Corrplot’: Visualization of a Correlation Matrix.


深圳裕策生物科技有限公司
地址:深圳市盐田区深盐路2002号大百汇中心4楼
中心实验室地址:深圳市大鹏新区生命科学产业园A28栋2楼
客服邮箱:
服务电话:400-9958-139
网址:www.yucebio.com